差异分析,往往是助文章提分的一大亮点。STAMP作为组间差异分析利器,其实2014年才问世,却在短短时间内受到众多迷弟迷妹的青睐,其来源文献[1]已被引用160+次。究其原因,不外乎功能强大、操作简单。今天,我们来认识STAMP,学学如何花样进行组间差异分析。
STAMP是什么?
STAMP软件是一款可以进行组间差异分析的强大软件。之所以说它强大,有三点原因:
一是因为它几乎适用所有的组间差异分析,可以是界门纲目科属种的多层级物种差异,也可以是基因表达差异、功能差异等单层级的差异。
二则是因为它的分析手段十分多样,如PCA散点图、聚类热图、差异条形图等。
除此之外,它还强大在简单易学的操作。接下来,我们通过一组实例简单介绍一下这款软件。
2
对输入文件有何要求?
两种输入方法
第一种为直接在File目录下选择Load data。文件要求详见下一节“第一种输入方法的具体说明”。
图1-1. 文件输入方式(一)
另一种则是选择File下的Creat STAMP profile from,将MG-RAST、BIOM、RITA、mothur、CoMet五种文件转化成STAMP可识别的数据。
图1-2 文件输入方式(二)
第一种输入方法的具体说明
在这种输入方法下,我们需要输入一或两个文件,必须输入的是Profile file,可选择的是Group file。Profile file是各个样品在各个层级下的丰度文件(如图2),Group file是各样品的分组情况(如图3)。
图2是以两个层级为例的丰度文件,表中前两列是层级名称,从第三列开始则是样品名称及其丰度。需要注意的是,层级的排列必须是按照细化程度由低到高,如图2中LEVEL2是LEVEL1的细化分级,则LEVEL1一列要在LEVEL2一列之前;再举个例子,如果以科、属、种为三个层级,那么前三列必须要按顺序为科、属、种的名字。
图2. 样品丰度示例表
在图3(分组情况表)中,第一列是每个样品的名称,第二列则是样品对应的组别。需要注意的是,Profile file可以含有Group file中不存在的样品,但是反之则不可以。
图3. 样品分组示例表
3
如何展示分析结果?
输入文件后,就可以设置分析参数,定制专属图片了。在本例中,我们将图2与图3作为输入文件来介绍一下STAMP的分析界面(图4)。
图4. 分析模式选择
首先,我们可以选择所要分析的层级,点击图4中红色箭头所指部分的Profile level进行选择。本例选择图2输入文件中的LEVEL2。
选定分析层级后我们可以选择三种分析模式,点击图4中绿色箭头所指位置进行选择,其中Two samples是选择两个样品进行分析,并可选择其在图中的颜色;Two groups是按照样品的分组选择两个组别进行分析并可选择指定组对应的颜色;Multiple groups是按照样品的分组对所有的组别进行分析。
设置好参数,就可以选择图片展示形式了。接下来,我们来简单看几款STAMP可实现的分析。
PCA分析
PCA分析适用于多组和两组的分析模式。
选择方式:点击图5中红色箭头指示的位置选择PCA plot。
展示图调整方式:点击如图5中蓝色箭头所指区域的Two groups或Multiple groups可切换全组别和双组别显示,在选定双组别模式下点击Group1和Group2可选择你所关心的两个组名。如果对分析图的样式,如比例、图例位置等不满意可通过点击图5中绿色箭头所指位置进行调整。
图5. PCA分析界面
热图分析
热图分析适用于多组和两组的分析模式,选择方式、展示图调整方式均与PCA分析类似,在图5中红色箭头所指处选择Heatmap plot可查看热图。以层级二(功能注释)的全组别热图(如图6)为例简单介绍一下热图分析,横向的是该功能注释在各样品上的分度,上方的则是样品间的聚类;纵向的是该样品在各功能注释上的丰度,左侧则是功能注释间的聚类。
图6. 热图示例
差异分析
差异分析适用于两组和两个样品的分析模式,选择方式、展示图调整方式均与PCA分析类似,在图5中红色箭头所指处选择Extended error bar可查看差异分析图(如图7)。差异分析图的意义在于,可以直观地比较两组或两个样品间在物种或者功能等层面上的差异。
图7 差异分析图样品A1-B1示例
4
输出格式有哪些?
最后要保存图片时,在File目录下选择Save plot即可,可输出的图片格式有png、svg、pdf等。
适用范围这么广,分析手段那么多,图片输出格式又是辣么周全,这样的STAMP能不让大家伙喜欢嘛!小锐家的STAMP差异分析做得老厉害了,您要不要来一打呢~
STAMP来源文献
[1]Parks D H, Tyson G W, Hugenholtz P, et al. STAMP: statistical analysis of taxonomic and functional profiles[J]. Bioinformatics, 2014, 30(21): 3123-3124.
推荐阅读
供稿:王璇琦
编辑:王丽燕